在本文中,我们为全向机器人提供了一种积极的视觉血液。目标是生成允许这样的机器人同时定向机器人的控制命令并将未知环境映射到最大化的信息量和消耗尽可能低的信息。利用机器人的独立翻译和旋转控制,我们引入了一种用于活动V-SLAM的多层方法。顶层决定提供信息丰富的目标位置,并为它们产生高度信息的路径。第二个和第三层积极地重新计划并执行路径,利用连续更新的地图和本地特征信息。此外,我们介绍了两个实用程序配方,以解释视野和机器人位置的障碍物。通过严格的模拟,真正的机器人实验和与最先进的方法的比较,我们证明我们的方法通过较小的整体地图熵实现了类似的覆盖结果。这是可以获得的,同时保持横向距离比其他方法短至39%,而不增加车轮的总旋转量。代码和实现详细信息作为开源提供。
translated by 谷歌翻译
Recently, learning-based controllers have been shown to push mobile robotic systems to their limits and provide the robustness needed for many real-world applications. However, only classical optimization-based control frameworks offer the inherent flexibility to be dynamically adjusted during execution by, for example, setting target speeds or actuator limits. We present a framework to overcome this shortcoming of neural controllers by conditioning them on an auxiliary input. This advance is enabled by including a feature-wise linear modulation layer (FiLM). We use model-free reinforcement-learning to train quadrotor control policies for the task of navigating through a sequence of waypoints in minimum time. By conditioning the policy on the maximum available thrust or the viewing direction relative to the next waypoint, a user can regulate the aggressiveness of the quadrotor's flight during deployment. We demonstrate in simulation and in real-world experiments that a single control policy can achieve close to time-optimal flight performance across the entire performance envelope of the robot, reaching up to 60 km/h and 4.5g in acceleration. The ability to guide a learned controller during task execution has implications beyond agile quadrotor flight, as conditioning the control policy on human intent helps safely bringing learning based systems out of the well-defined laboratory environment into the wild.
translated by 谷歌翻译
联合学习(FL)是标准集中学习范式的最吸引人的替代方案之一,允许异质的设备集训练机器学习模型而无需共享其原始数据。但是,FL需要中央服务器来协调学习过程,从而引入潜在的可扩展性和安全性问题。在文献中,已经提出了诸如八卦联合学习(GFL)和支持区块链的联合学习(BFL)之类的无服务器的方法来减轻这些问题。在这项工作中,我们提出了这三种技术的完整概述,该技术根据整体性能指标进行比较,包括模型准确性,时间复杂性,交流开销,收敛时间和能源消耗。广泛的模拟活动允许进行定量分析。特别是,GFL能够节省18%的训练时间,68%的能源和51%的数据相对于CFL解决方案,但无法达到CFL的准确性水平。另一方面,BFL代表了一个可行的解决方案,用于以更高级别的安全性实施分散的学习,以额外的能源使用和数据共享为代价。最后,我们确定了两个分散的联合学习实施的开放问题,并就该新研究领域的潜在扩展和可能的研究方向提供见解。
translated by 谷歌翻译
当今的车辆越来越多地嵌入了产生大量数据的计算机和传感器。这些数据是为了内部目的而利用的,随着连接的基础架构和智能城市的开发,车辆相互交互,以及与生成其他类型数据的道路使用者相互作用。对这些数据和车载资源及其货币化的访问面临本文提出的许多挑战。此外,与H2020 5GMETA项目中所面临的开放和新颖方法相比,最重要的商业解决方案。
translated by 谷歌翻译
基于视觉的感知任务在机器人技术中扮演着重要角色,促进解决许多具有挑战性的情景的解决方案,例如自动无人驾驶汽车(UAV)的杂技演习以及机器人辅助的高精度手术。大多数以控制为导向的和以自负的感知问题通常是通过利用机器人状态估计作为辅助输入来解决的,尤其是当人工智能进入图片时。在这项工作中,我们建议第一次采用类似的方法(据我们所知),将目标变量引用于外部主题。我们证明了我们的一般和直观方法论如何改善深层卷积神经网络(CNN)的回归性能,并具有模棱两可的问题,例如同类3D姿势估计。通过分析三个高度差异的用例,从用机器人臂抓住到具有袖珍尺寸无人机的人类受试者,我们的结果始终将R2度量提高到+0.514,而不是其无状态基准。最后,我们验证了人类姿势估计任务中闭环自动袋大小的无人机的现场性能。我们的结果表明,在我们的状态CNN的平均绝对误差上,平均降低了24%。
translated by 谷歌翻译
最近的工作表明,视觉变压器(VTS)的注意力图在接受自学训练时,可以包含一种语义分割结构,在监督训练时不会自发出现。在本文中,我们明确鼓励这种空间聚类的出现作为一种培训正规化的形式,这种方式包括在标准监督学习中进行自我监督的借口任务。更详细地,我们根据信息熵的空间公式提出了一种VT正则化方法。通过最大程度地减少提议的空间熵,我们明确要求VT生成空间有序的注意图,这是在训练过程中包括基于对象的先验。使用广泛的实验,我们表明,在不同的培训方案,数据集,下游任务和VT体系结构中,提出的正则化方法是有益的。该代码将在接受后可用。
translated by 谷歌翻译
本文介绍了提交给SHREC 2022坑道轨道和路面裂纹检测的方法。总共比较了道路表面的语义分割的7种不同的运行,参与者和基线方法的6个。所有方法都利用深度学习技术及其性能使用相同的环境(即:单个Jupyter笔记本)进行测试。由3836个语义细分图像/蒙版对组成的培训集和797个带有最新深度摄像机的RGB-D视频片段组成。然后,在验证集中的496个图像/掩码对上,测试集中的504对,最后在8个视频剪辑上评估该方法。结果的分析基于用于图像分割和视频剪辑定性分析的定量指标。参与和结果表明,该方案引起了人们的极大兴趣,在这种情况下,使用RGB-D数据仍然具有挑战性。
translated by 谷歌翻译
在网络中找到最有影响力的节点是一个计算困难的问题,其中有多种基于网络的问题的几个可能的应用程序。尽管已经提出了几种解决影响最大化问题(IM)问题的方法,但当网络大小增加时,它们的运行时间通常会缩放较差。在这里,我们提出了一种基于网络缩减的原始方法,该方法允许多目标进化算法(MOEA)在减少的比例网络上解决IM问题,同时保留原始网络的相关属性。然后使用基于中心度指标(例如Pagerank)的机制将缩小的解决方案升级到原始网络。我们在八个大型网络(包括$ \ sim $ 50k节点)上的结果证明了该方法的有效性,与原始网络所需的时间相比,运行时增益超过10倍,最高为82美元\%与CELF相比,$减少了时间。
translated by 谷歌翻译
我们解决了在存在障碍物的情况下,通过一系列航路点来解决四肢飞行的最低时间飞行问题,同时利用了完整的四型动力学。早期作品依赖于简化的动力学或多项式轨迹表示,而这些动力学或多项式轨迹表示,这些表示没有利用四四光的全部执行器电位,因此导致了次优溶液。最近的作品可以计划最小的时间轨迹;然而,轨迹是通过无法解释障碍的控制方法执行的。因此,由于模型不匹配和机上干扰,成功执行此类轨迹很容易出现错误。为此,我们利用深厚的强化学习和经典的拓扑路径计划来训练强大的神经网络控制器,以在混乱的环境中为最少的四型四型飞行。由此产生的神经网络控制器表现出比最新方法相比,高达19%的性能要高得多。更重要的是,博学的政策同时在线解决了计划和控制问题,以解决干扰,从而实现更高的鲁棒性。因此,提出的方法在没有碰撞的情况下实现了100%的最低时间策略的成功率,而传统的计划和控制方法仅获得40%。所提出的方法在模拟和现实世界中均已验证,四速速度高达42公里/小时,加速度为3.6g。
translated by 谷歌翻译
在自然语言中,在不同级别的特异性中引用对象是在上下文中有效沟通的基本务实机制。我们开发了一个新颖的沟通游戏,即层次参考游戏,以研究人造代理中这种参考系统的出现。我们考虑了一个简化的世界,其中概念是一组原始属性(例如颜色,样式,形状)的抽象。根据组合数量的属性,概念更一般(“圆”)或更具体的(“红色虚线圆”)。基于上下文,代理必须在该层次结构的不同级别进行交流。我们的结果表明,代理商学会了成功玩游戏,甚至可以推广到新颖的概念。为了获得抽象,他们使用隐式(省略无关信息)和明确(表明属性是无关紧要的)策略。此外,概念层次结构基础的组成结构反映在紧急协议中,表明开发层次参考系统的需求支持组成性的出现。
translated by 谷歌翻译